查看原文
其他

Gemma 2 上线了

renee创业狗 Renee 创业随笔
2024-10-09

Gemma 2 是 Google 的开放模型,Google IO的时候发布,接着上周上线了。之前已经介绍过 Gemma 1,今天看看 Gemma 2有哪些迭代。

简介

上周,Google正式向全球研究人员和开发人员发布 Gemma 2。Gemma 2 提供 90 亿(9B)和 270 亿(27B)参数两种规格,相较于第一代,性能更高,推理效率更佳,并且在安全性方面有了显著提升。27B 参数的 Gemma 2 提供了与体积大一倍以上的模型相媲美的竞争力(感觉说的是Llama3,能够实现之前仅在去年十二月才能通过专有模型实现的性能(感觉说的是GPT4)。可以跑在 NVIDIA H100 Tensor Core GPU 或 TPU 主机,大大降低了部署成本。

特点

  • 卓越性能:27B 参数的 Gemma 2 提供最佳性能,甚至超越体积大一倍以上的模型。9B 参数的 Gemma 2 也超越了 Llama 3 8B 及其他同类开放模型。

  • 高效节约:27B 参数的 Gemma 2 可在 Google Cloud TPU、NVIDIA A100 80GB 或 H100 上高效运行,降低成本的同时保持高性能,使 AI 部署更具经济性。

  • 极速推理:Gemma 2 优化后可在各种硬件上高速运行,从游戏笔记本到云端设置。在 Google AI Studio 以全精度体验,通过 Gemma.cpp 在 CPU 上解锁本地性能,或在家用计算机上使用 NVIDIA RTX 或 GeForce RTX。


评测

官方提供的基准测试结果:

LMSYS Chatbot Arena Leaderboard:

Gemma 家族其他产品

  • PaliGemma:是一个多功能、轻量级的视觉语言模型(VLM),灵感来自 PaLI-3,基于 SigLIP 视觉模型和 Gemma 语言模型等开放组件构建。
  • RecurrentGemma:一个具有固定状态大小的开放模型,适用于对长序列进行快速推理。
  • CodeGemma:基于 Gemma 的开放代码模型。

试用

除了上文提到的Google AI Studio,Gemma 2 也通过与 Hugging Face、NVIDIA 和 Ollama 等平台的集成,轻松获取。

Ollama

  • 9B 参数
ollama run gemma2
  • 27B 参数
ollama run gemma2:27b

编排工具中使用 Gemma2

LangChain

from langchain_community.llms import Ollama
llm = Ollama(model="gemma2")
llm.invoke("Why is the sky blue?")

LlamaIndex

from llama_index.llms.ollama import Ollama
llm = Ollama(model="gemma2")
llm.complete("Why is the sky blue?")
继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存